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Beschreibung 

Die Erfindung betrifft ein Bildaufnahmeverfahren und eine Bildaufnahmevorrichtung zur Aufhahme von Bilddaten ei- 
ner Zeichenzeile, wobei eine Aufhahmevorrichtung zur Abtastung einer \forlage, urn die Bilddaten einer Zeichenzeile zu 
5 lesen, und einer Verarbeitungsvorrichtung vorgesehen sind, urn unter Beriicksichtiguhg einer tatsachlichen Zeichentei- 
lung die Bilddaten fur eine 0(ZR-Erkennung vorzubereiten, um so verzerrungsfreie Bilddaten zu erhalten. 

In den letzten Jahren ist die OCR-Erkennung, also die Umwandlung von Bilddaten in Textdaten, zunebmend wichtiger 
geworden. Voraussetzung fiir eine einwandfreie OCR-Erkennung ist es allerdings, dass die Bilddaten der OCR-Software 
mil einer gleichbleibend guten Qualilat zugefuhrt werden. 
10 Wenn die Bilddaten fur die OCR-Erkennung iiber eine Bildaufnahmevorrichtung, beispielsweise einen Scanner, ein- 
gelesen werden, stellt sich das Problem, dass die erhaltenen Bilddaten aufgrund von Scannereigenschaflen nicht verzer- 
rungsfrei sind, was zu Schwierigkeiten bei der OCR-Erkennung fubren kann. Dies ist insbesondere bei handgefuhrten 
Scannem ein emstes Problem. 

Bei einem handgefuhrten Scanner werden die Zeichen je nach Geschwindigkeit beim Scannen, die zwischen 5 und 
15 150 crn/sek. liegen kann, beliebig stark verzerrt. Um dieses Problem zu losen, gab es bisher zwei Ansatze. Zum einen of- 
fenbart US-5,250,804 einen handgehaltenen Scanner mit einem Taktrad. Wenn der Scanner iiber eine Vorlage bewegt 
wird, dreht sich das Taktrad und gibt ein MaB fur die Geschwindigkeit, das an den Computer ubermittelt wird. Ein Nach- 
teil dieser Bauweise ist es, dass nur sehr geringe Scanngeschwindigkeiten moglich sind, eine sehr saubere Scannfuhrung 
erforderlich ist, und dass das Taktrad eine sehr begrenzte T^ebensdauer hat. 
20 Ein zweiter Ansatz sieht vor, ein zweidimensionales Photodiodenarray in der Lesevorrichtung einzusetzen. Wird die- 
ses Photodiodenarray hinreichend grofi gewahlt, ist es mSglich, ein Normzeichen mit einem Scannzyklus zu erfassen. 
Der Nachteil hierbei ist, dass zweidimensionale Arrays relativ teuer sind, und dass breite Normschriften nicht gelesen 
und erkannt werden konnen, da Teile eines Zeichens vom Fiachensensor nichl erfassl werden. 

Aufgabe der Erfindung ist es, ein verbessertes Bildaumahmeverfahren und eine verbesserte Bildaufnahmevorrichtung 
25 zu schaffen, die weitgehend verbesserungsfrei arbeiten. 

ErfindungsgcmaB wird dicsc Aufgabe durch cin Vcrfahrcn nach Anspruch 1 bczichungswcisc cine Vorrichtung nach 
Anspruch 11 gelost. Die abhangigen Anspriicbe betreffen weitere vorteilhafte Aspekte der Erfindung. 

Bei dem erfindungsgemaBen Verfahren zur Aufhahme von Bilddaten einer Zeichenzeile wird eine Zeichenzeile einer 
Vorlage zum Lesen von Bilddaten abgetastet und die Bilddaten fur eine OCR-Erkennung vorbereitet, wobei die Zeichen- 
30 teilung beruhend auf den Bilddaten bestimmt wird. 

Bei einem solchen Verfahren ist die Verwendung eines Taktrades, welches relativ schnell kaputt gehen kann, entbehr- 
lich. Zudem lassen sich Scanngeschwindigkeiten von mehr als 1 m/Sek. erreichen. Die Anforderungen an die Genauig- 
keit der Scannerfuhrung sind geringer und das Verfahren ist einfacher durchfuhrbar, da keinerlei bewegliche Teile ver- 
wendet werden. 

35 Eine vorteilhafte Ausgestaltung des erfindungsgemafien Verfahrens ist dadurch gekennzeichnet, dass die Zeichentei- 
lung aus dem Abstand aufeinanderfolgender Zeichen bestimmt wird. Hierdurch wird in einfacher Weise ein jeweils ak- 
tuelles MaB fiir die Zeichenteilung erhalLen. 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass zusatzlich die 
Ubergangsscharfe an den Zeichenkanten bestimmt wird, wobei die Ubergangsscharfe zur Uberpriifung der aus dem Ab- 

40 stand zwischen aufcinandcrfolgcndcn Zeichen crmittcltcn Zeichenteilung dicnt. Hierdurch laBt sich die Zuvcrlassigkcit 
der ermittelten Zeichenteilung erhohen, was insbesondere dann von Bedeutung ist, wenn die Zeichen in horizontaler 
Richtung Unterbrechung aufweisen, so dass irrelevante Zeichenzwischenraume entstehen, die zu einer fehlerhaften Br- 
mittlung der Zeichenteilung fuhren konnten. 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass die gelesenen 

45 Bilddaten komprimiert werden. Da insbesondere bei langsamem Scannen sehr groBe Datenmengen entstehen konnen, 
laBt sich auf diese Weise ein wesentliches MaB an Speicherplatz und -zeit einsparen. 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahren ist dadurch gekennzeichnet, dass die komprimier- 
ten Bilddaten als die Grauwerte in einem SRAM einer Zeichenerkennungseinheit fiir Grauwert-Videodaten abgespei- 
chert werden. Das Abspeichem in Form von Grauwerten hat gegentlber dem Abspeichem in binarisierter Form den \br- 

50 teil, dass sich durch die Analyse von WeiB-schwarz- beziehungsweise Schwarz-weiB-Ubergangen relevante Zleichenteile 
von Zeichen naher untersuchen lassen. 

Die erfindungsgemaBe Bildaufnahmevorrichtung zur Aufhahme von Bilddaten einer Zeichenzeile enthalt eine Auf- 
nahme vorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen und eine Verarbeitungsvor- 
richtung, um unter Bcriicksichtigung cincr tatsachlichen Zeichenteilung die Bilddaten fiir cine OCR-Erkennung vorzu- 

55 bereiten, um so verzerrungsfreie Bilddaten zu erhalten. Die erfindungsgemaBe Vorrichtung ist dadurch gekennzeichnet, 
dass die Verarbeitungsvorrichtung ausgestattet ist, um den Abstand zwischen aufeinanderfolgenden Zeichen der Zei- 
chenzeile und somit ein MaB fur die tatsachliche Zeichenzeile zu bestimmen. 

Ein Vorteii der Erfindung besteht darin, dass kein Taktrad notig ist, somit also keine mechanischen Teile vorUegen, die 
relativ schnell kaputtgehen konnen. Mit der erfindungsgemaBen Vorrichtung sind Scanngeschwindigkeiten von mehr als 

60 1 m/sek. moglich. Auch die Anforderungen an die Genauigkeit der Scannerfuhrung sind geringer als beim Stand der 
Technik. Die gesamte Vorrichtung wird durch das Verrneiden mechanischer Teile billiger, robuster und einfacher in der 
Handhabung. 

Eine vorteilhafte Ausgestaltung der erfindungsgemaBen Bildaufnahmevorrichtung ist dadurch gekennzeichnet, dass 
die Verarbeitungsvorrichtung in der Lage ist, den Abstand zwischen aufeinanderfolgenden Zeichen zu ermitteln und aus 
65 diesem Abstand die Zeichenteilung bestimmen. 

Eine vorteilhafte Ausgestaltung der erfindungsgemaBen Bildaufnahmevorrichtung ist dadurch gekennzeichnet, dass 
die Verarbeitungsvorrichtung derart ausgestaltet ist, dass sie zusatzlich die Ubergangsscharfe an den Zeichenkanten be- 
stimmt, wobei die Obcrgangsscharfc cin MaB fur die Zeichenteilung ist. In Abhangigkcit der Geschwindigkeit des 
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Scannvorgangs gibt es an Schwaiz-WeiB- bzw. WeiB-Schwarc-Obergangen sogenannte Graukegel. Die GrdBe dieser 
Graukegei ist ebenfalls ein MaB fur die Scanngeschwindigkeit bzw. fur die Zeichenteilung. Insbesondere bei schlechten 
Vorlagen, bei denen einzelne Zeichen der abzuscannenden Zeichenzeile unvollstandig wiedergegebeh sind, bietet die Be- 
stimmung der Ubergangsscharfe eine zusatzliche Uberpriilungsmoglichkeit fur den vorhergehend bestimmten Zeichen- 
abstand. Die Vorrichtung wird auf diese Art noch leichter in der Handhabung. 5 

Eine vorteilhafte Ausgestaltung der erfindungsgemaBen Bildaufnahmevorrichtung ist dadurch gekennzeichnet, dass 
die Verarbeitungsvorrichtung zusatzlich die Ubergangsscharfe an den Zeichenkanten bestirnrnt, wobei die Ubergangs- 
scharfe zur Ubeiprufung der aus dem Zeichenabstand ermittelten Zeichenteilung dient 

Eine vorteilhafte Ausgestaltung der erfindungsgemaBen Bildaufnahmevorrichtung ist dadurch gekennzeichnet, dass 
die Aufnahrnevorrichtung als handgefiihrter Scanner ausgeschaltet ist Von diesem handgefuhrten Scanner werden die 10 
gewonnenen Bilddaten durch ein geeignetes Mittel, beispielsweise ein Kabel oder eine Infrarotschnittstelle, an die \fer- 
arbeitungsvorrichtung der BUdautViahmevorrichtung ubertragen. Insbesondere bei handgefuhrten Scannem variiert die 
Scanngeschwindigkeit sehr stark. Urn dennoch eine effiziente OCR-Erkennung durchfuhren zu konnen, ist daher eine zu- 
verlassige Gewinnung verzerrungsfreier Daten erforderlich. 

Eine vorteilhafte Ausgestaltung der erfindungsgemaBen Bildaufnahmevorrichtung ist dadurch gekennzeichnet, dass 15 
die Vorrichtung einen Speicher um die Bilddaten zwischenzuspeichern. In dem Speicher konnen daher in vorteilhafter 
Weise die abgetasteten Bilddaten und die entzerrten Bilddaten vor der Verarbeitung durch die OCR-Software zwischen- 
gespeichert werden. 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass es das Kornpri- 
mieren der eingelesenen Bilddaten uhd Speichern als Grauwerte in einem SRAM-Puffer, das Abspeichern von Grauwert- 20 
stutzpunkten zum Bilden einer komprimierten Tapete, das Bilden von Zeichenrnittenabstanden aufeinanderfolgender 
Zeichen, das Bilden von Scanngeschwindigkeitswerten und Einiragen dieser Scanngeschwindigkeitswerte in die kom- 
primierte Tapete und das Dekompriinieren der kompriiiderten Tapete umfassl. Auf diese Weise laBt sich ein geschwin- 
digkeitskorrigiertes Band von Zeichen erhalten, welches anschlieBend einer OCR-Zeichenerkennung zugefuhrt werden 
kann. 25 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass zum Bilden der 
Grauwertstutzpunkte die als Grauwerte abgespeicherten Bilddaten zeilenweise uriter Bildung von Grauwertdifferenzen 
zu einem fur jede Zeile ermittelten WeiBwert untersucht werden, wobei bei Oberschreiten einer vorbestimmten Grau- 
wertdifferenz ein Grauwertstiitzpunkt in den SRAM-Puffer eingetragen wird. Anhand der auf diese Weise ermittelten 
Grauwertstutzpunkte lassen sich die zu einer Zeile gehorenden reievanten Pixel in einfacher Weise durch Addition der 30 
Differenz der Grauwertstutzpunkte zwischen minimal em und maximal cm Grauwert anhand einer dynamisch einstellba- 
ren Schwelle ermitteln. 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass vor dem Bilden 
von Zeichenrnittenabstanden aufeinanderfolgender Zeichen Grauwerte unterhalb eines jeweiligen Schweilenwertes auf 0 
gesetzt werden, wobei die Schwellenwerte jeweils zeilenweise abhangig von einem maximalen, in horizontaler Richtung 35 
ermittelten Grauwert gebildet werden, wodurch sich eine Schattenbildung der Zeichen durchfuhren laBt. 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass die Scannge- 
schwindigkeitswerte aus den Mittenabstanden aufeinanderfolgender Zeichen mitteis einer Mehrheitssuche bestirnrnt 
werden. Durch die Mehrheitssuche lassen sich Verfalschungen aufgrund von Unterbrechungen im Zeichen oder bei Zei- 
chen ohnc WciBluckc Ycrmcidcn. 40 

Eine vorteilhafte Ausgestaltung des erfindungsgemaBen Verfahrens ist dadurch gekennzeichnet, dass bei der Ermitt- 
lung der Scanngeschwindigkeiten die Steigungsmafie der Schwarz-weiB-beziehungsweise WeiB-schwarz-Ubergange der 
Zeichenteile in horizontaler Richtung ermittelt werden. Hierdurch werden Storungen bei der Errnittlung der Zeichentei- 
lung bei verstummelten Zeichen mit irrelevanten Zeichenzwischenraumen vermieden. 

Ausfuhrungsbeispiele der Erfindung ergeben sich aus der vorliegenden Beschreibung der beihegenden Zeichnungen, 45 
in denen zeigt 

Fig* 1 Rohbilddaten nach der Abtastung mit einem handgefuhrten Scanner; 

Fig. 2 die entzerrten Bilddaten; 

Fig. 3 die Grauwertverteilung der Zeile 28 aus Fig. 1; 

Fig. 4 die Grauwertverteilung der Zeilen 27, 28 und 29 eines Ausschnittes aus Fig. 1 ; 50 
Fig. 5 eine Darstellung der GrauwertsUitzpunktverteilung; 
Fig. 6 ein Russdiagramm des erfindungsgemaBen Verfahrens. 

Im Folgenden wird die Erfindung detailliert anhand einer bevorzugten Ausfuhrungsform beschrieben. 

Erfindungsgcmafi werden OCR-Zcichen optisch abgctastct, die so crhaltcncn Mdcodatcn komprimicrt, die Zwischcn- 
raume der OCR-Zeichen aufgefunden und der Abstand zweier Zeichen ermittelt, um dadurch ein MaB fur die aktuelle 55 
Zeichenteilung zu bekommen. Die Kompressibn der Videodaten ist nicht notig, aber sinnvoll, da bei langsamem Scannen 
sehr groBe Datenmengen entstehen konnen und damit vie! Speicher und Rechenzeit benodgt wird. Bei der Dekompri- 
mierung der X^deodaten wird die Zeichenteilung strichgenau beriicksichdgt. Die Soll-Zeichenteilung fur gangige OCR- 
Normschriften betragt im Normalfall zehn Zeichen pro Z6U. Auf diese Zeichenteilung werden die Zeichen nprmiert. 

In manchen Fallen kann es bei Zeichen vorkommen, dass sie in horizontaler Richtung Unterbrechungen haben, ( so dass 60 
ein irrelevanter Zeichenzwischenraum erkannt wird. Diese Zwischenraume konnen zu einer falschen Zeichenteilung 
fuhren. Aus diesem Grund wird in der erfindungsgemaBen Ausfuhrungsform ein zweiter Algorithmus angewendet, der 
die Scanngeschwindigkeit von Zeichen naherungsweise ermittelt. Das Ergebnis dient dazu, herauszufinden, ob bzw. wel- 
che Zeichenteilung plausibel ist. 

Der zweite Algorithmus betrachtet den WeiB-Schwarz- bzw. den Schwarz-WeiB-Ubergang einer Linie eines Zeichens 65 
in horizontaler Richtung. In der Zeichenzeile werden relevante Zeichenteile von Zeichen gesucht Relevant sind Zei- 
chenteile, wenn sie groBer als zwei Zeichenpixel breit sind und von einem Zeichen mit einer annahernd senkrechten Zei- 
chenkante stammcn. Hicrfur werden die Nachbarpixcl in vcrtikalcr Richtung untersucht Wcnh cin dcrartig rclcvantcr 
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Zeichenteil vorliegt, kann die Larige des "Graukeils" am WeiB-Schwarz- bzw. Schwarz-WeiB-Ubergang, namlich die Un- 
scharfe der Kante, ein MaB fur die Abtastgeschwindigkeit geben. Hierfur ist es erforderlich, dass die Videodaten nicht bi- 
narisiert, sondern Grauwerte enthalten. 

Am Hnde entsteht eine geschwindigkeitskorrigierte und somit entzerrte Zeichenzeile. Diese Zeichenzeile kann nun ei- 
5 ner OCR-Zwischenerkennung zugefuhrt werden, die die Bilddaten in Textdaten umwandelt 

Entsprechend einer bevorzugten Ausfuhrungsform fuhrt die erfindungsgemaBe Bildaufnahmevorrichtung folgende 
Verarbeitungsprozedur durch. Zunachst wird mit einer Aufnahmevorrichtung eine Zeichenzeile abgescannt. Das Ergeb- 
nis dieses Scannvorgangs ist in Fig. 1 gezeigt. Durch die unterschiedlich schnelle Bewegung der Aufnahmevorrichtung 
uber die Zeichenzeile entsLehl eine Verzerrung der einzelnen Zeichen. Diese Verzerrung erschwerl es den gangigen OCR- 
10 Programmen die abgetastete Zeichenzeile in Text umzuwandeln. 

Das erfindungsgemaBe Verfahren zur Aufhahrne von Bilddaten wird im Folgenden anhand des in Fig. 6 dargestellten 
Flussdiagramms detailliert erlautert 

Mittels der in Fig. 6 dargestellten Prograrnmabfolge werden die eingelesenen Videodaten komprimiert und in das 
SRAM einer Zeichenerkennungseinheit fur Grauwert- Videodaten mit 6 Bit Grauwerten abgespeichert. Nachdem der Be- 
15 leg gescannt wurde, werden die komprimierten Daten dekomprimiert und geschwindigkeitskorrigiert in den Bildspeicher 
abgespeichert und von dort wiederin das SRAM als sogenannte Tapete abgespeichert. Nachdem die Tapete wieder in den 
Bildspeicher ubertragen wurde, kann das Programm zur Zeichenerkennung durchgefuhrt werden. 

GemaB Fig. 6 iauft das beim handgefuhrten Lesen der Bilddaten verwendete Programm folgendermaBen ab: 

Zunachst wird mittels eines Programms 200 ein Programm 202 zur Bildung von Stiitzpunkten fur die kornprimierte 
20 Tapete initialisiert Bei Durchruhrung des Programms 200 wird ein SRAM-Puffer aufgebaut. In diesem Puffer werden 
die Daten von 64 Zeilen abgespeichert. Pro Zeile gibt es vier Werte: Spaltenadresse, WeiBwert, letzter abgespeicherter 
Grauwert und Status. 

Die Hardware arbeitet im Transparenlmodus, das heiBt, die Grauwerte des Scanners werden unverfalscht in die Zei- 
chenerkennungseinheit fur Grauwert- Videodaten eingetragen. Der WeiBwert wird aus den ersten 32 Pixeln der jeweili- 
25 gen Zeile gebildet, indem der weiBeste Wert gesucht wird. Der Status ist am Anf ang Null. 

Nach dicscr Irritialisicrung des SRAM-Puffcrs werden die Spaltcnadrcsscn und die Zcilcnadrcsscn der Pixel der An- 
fangsspalte in den Puffer eingetragen. Dies sind Pixel von 64 Zeilen. Am Ende einer Spalte wird ein Zeilenendecode 
(OxcOOO) und die Zeilenadresse des letzten Pixels eingetragen. 

AnschlieBend wird das Programm 202 zur Bildung der Stiitzpunkte fur die kornprimierte Tapete durchgefuhrt Hierbei 
30 werden pro Spalte die Pixel von Zeile 0 bis Zeile 63 untersucht, ob sie in horizontaler Richtung rechts Grau wertdiff eren- 
zen von groBer als 3 in Bezug auf den WeiBwert aufweisen. Ist das nicht der Fall, wird das nachste Pixel (die nachste 
Zeile) in horizontaler Richtung untersucht. 

1st die jeweilige Grauwertdifferenz groBer als 3, wird in der vorherigen Zeile (n - 1 ) der Status 1 gesetzt Mit der nach- 
sten Spalte wird dieses Pixel (Grauwertsrtitzpunkt) dann in den Speicher SRAMZ mit der Spaltenadresse und Zeilen- 
35 adresse abgespeichert. In der entsprechenden Zeile im Puffer WEZ wird der Status 8 eingetragen. Diese Zeile wird nun 
spaltenweise verfolgt In den SRAMZ-Puffer wird immer dann ein Pixel mit Spaltenadresse und Zeilenadresse Ubertra- 
gen, wenn die GrauwertdilTerenz groBer als 3 wird oder wenii ein Umkehrpunkt vorhanden ist (weiB, schwarz, weiB oder 
schwarz, weiB, schwarz). Erreicht ein Grauwert bis auf 3 Grauwertstufen den WeiBwert, wird der Status auf 4 gesetzt. 
Mit der nachsten Spalte wird das Pixel nach FRAMZ ubertragen und der Status in dieser Zeile wird auf 0 gesetzt Jetzt 
40 wird cine ncuc Grauwertdifferenz gesucht. 

So wie mit dieser Zeile wird mit alien Zeilen verfahren. 

In Zeile 63 ist das Spaltenende erreicht. In den Speicher SRAMZ wird der Zeilenendecode OxcOOO eingetragen. Es 
werden so viele Spalten abgearbeitet, wie im Bildspeicher vorhanden sind. Die Bilddaten werden vom Programm 204 in 
das SRAM eingetragen, Liegen keine Bilddaten mehr vor, wird das Programm 202 verlassen und das Programm 204 auf- 
45 gerufen. 

Das Programm 204 dient zum Abspeichern der Grauwerte von den Stiitzpunkten. Hierbei werden die Adressen der Pi- 
xel aus dem Puffer SRAMZ geholt und die Pixel im Bildspeicher adressiert Die ausgelesenen Grauwerte (Byte) werden 
wortweise verpackt und in den Puffer WEZ (gleicher Name, neuer Puffer) in das SRAM eingetragen. Am Anf ang einer 
Spalte wird die Spaltenadresse und am Ende einer Spalte der Zeilenendecode (OxcOOO) ins SRAM eingetragen. 

50 Sind alle bisher gescannten Pixel im SRAM, wird untersucht, ob der Beleg noch vorliegt (Belegimpulsbildung). Ist 
dies der Fall, wird die Anzahl der Spalten berechnet, die der Einschreibzahler inzwischen in den Bildspeicher geschrie- 
ben hat. Diese Anzahl wird dem Programm 202 mitgeteilt, welches wieder aufgerufen wird. 

liegt kein Beleg mehr vor, wird die Schleife verlassen, und das Programm 206 wird. aufgerufen. In dem Puffer WEZ 
licgen jctzt die komprimierten Bilddaten. 

55 Das Programm 206 dient zum Suchen der gedruckten Zeile innerhalb der gesamten Tapete. Es ermittelt die Oberkante 
und die Unterkante der gesamten Zeile. Eingangsdaten sind die komprimierten Bilddaten aus dern Puffer WEZ. Das Pro- 
gramm 206 findet die relevanten Pixel, die zu einer Zeile gehoren. Es addiert in jeder Zeile die Diff erenz der Grauwert- 
Stiitzpunkte zwischen minimalem und maximalem Grauwert Mit einer dynamisch einstellbaren Schwelle wird am Ende 
die obere und untere Kante der Zeile gefunden. 

60 Das Programm 208 dient zum Holen abgespeicherter Grauwerte und zur Schattenbildung von Zeichen. Hierbei wird 
der vom Programm 206 ausgegebene Bereich ermittelt, pro Spalte der maximale Grauwert bestimmt und fur diese Spalte 
abgespeichert. Hierbei handelt es sich urn die Grauwerte der komprimierten Bilddaten. Parallel dazu wird pro Zeile eine 
Schwelle gebildet, die abhangig von einem maxirnalen Grauwert ist, der in horizontaler Richtung gebildet wird. Diese 
Schwelle wird nach jeder Spalte in jeder Zeile um zwei GrauWertstufen dekrementiert (schwarz = 3f, weiB = 0). Mit der 

65 nachsten Spalte kann ein neuer Grauwert (Grauwertstiitzpunkt) in dieser Zeile vorhanden sein. Der neue wird mit dem al- 
ten verglichen, der groBere wird abgespeichert. Der Maximal wert der Schwelle betragt 15, der Minimal wert 4. Liegt der 
Grauwert unterhalb der ermittelten Schwelle, wird er auf 0 gesetzt Diese neuen Grauwerte werden in das SRAM ge- 
schricben (neuer Puffer REZ). 
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AnschlieBend wird das Programm 210 durchgefuhrt, mittels dem die Zeichenmittenstande von Zeichen ermittelt wer- 
den. Aus dem SRAM-Puffer (REZ) werden die Spaltenadressen und maximalen Grauwerte ausgelesen urid entspre- 
chende Segmente gebildet. Je nach GroBe des maximalen Grauwerts eines Zeichen s (Zeichensegments) werden bis zu 3 
WeiBspalten zwischen den Zeichensegmenten zugelassen, so dass ein Zeichen aus mehreren Segmenten bestehen kann. 
Bei sehr schwach gedruckten Zeichen kommen haufig Unterbrechungen innerhalb des Zeichens vor. Von dem gegebe- 5 
nenfalls ziisammengesetzten Zeichen wird die Zeichennutte berechnet. Die Zeichenmittenadresse und die Zeichenbreite 
werden in den SRAM-Puffer (WEZ) eingetragen. Das Dateiende wird mit OxffrT gekennzeichnet, 

AnschlieBend wird aus den Daten des Puffers (WEZ) der Zeichenabstand zweier Zeichen ermittelt und an die Stelle 
der Zeichenbreile wieder in den Puffer (WEZ) eingetragen, Zuvor wird noch uberprQfl, ob eine groBere WeiBliicke zwi- 
schen den Zeichen besteht. Hierzu wird von dem Zeichenabstand die vierfache Zeichenbreite subtrahiert. 1st der verblei- 10 
bende Abstand grdBer als 32, liegt eine groBere WeiBliicke vor. Im Zeichenabstand (spater = V-Wert) wird das hochste 
Bit 1 gesetzt Der V-Wert ist ein MaB fur die Geschwindigkeit des Belegs. 1st der V-Wert 1,0, liegt die Normgeschwin- 
digkeit vor. Das es sich um handgefuhrtes Lesen handelt, kann die Beleggeschwindigkeit variieren. Wenn also eine gro- 
Bere Zeichenlucke vorhanden ist, muss nach dieser Liicke die Geschwindigkeit neu berechnet werden. Dies wird mittels 
der Programme 212 und 214 durchgefuhrt, die dieses Bit abfragt 15 

Das Programm 212 ermittelt die V-Werte (a und b) fur die ersten maximal 8 Werte. Der V-Wert (a) entspricht genau 
dem Mi ttenabstand zweier benachbarter Zeichen. Ist dieser Abstand 16 Spalten groB, dann liegt die Normgeschwindig- 
keit vor. Bei 10 Zeichen/Zoli und 160 Micrometer Pixelauflosung betragt der Zeichenabstand 16 Spalten. Parallel dazu 
wird das hochste Bit des V-Wertes abgefragt Tst dieses 1 , wird die Bearbeitung beendet und Programm 214 wird aufge- 
rufen. Es wird erst bei dem nachsten Aufruf dieses Programms 212 f ortgefahren. Die Programme 212 und 214 werden in 20 
einer Schleife solange aufgerufen, bis der Endecode Oxffff kommL 

Die V-Werte (a) konnen durch Unterbrechungen im Zeichen oder bei Zeichen ohne WeiBliicke stark verfalscht sein. 
Deshalb wird eine Mehrheitssuche unter den ersten 8 Werten durchgefuhrt. Die Zeichenabstande, die am haufigsten vor- 
kommen, bestimmen den V-Wert der anderen. Die Haufigkeitsverteilung wird mittels Histogramm ermittelt Die ermit- 
teiten V-Werte werden in den Puffer (WEZ) eingetragen. 25 

In Fallen, bei denen Zeichen vcrstummclt sind, kann es zu crhcblichcn Storungcn bei der Ermittlung der Zcichcntci- 
lung kommen, so dass keine eindeutige Entscheidung fur einen V-Wert getroffen werden kann. Fehlt zum Beispiel bei ei- 
ner "0" oben und unten der Querstrich, dann ist der V-Wert fur dieses Zeichen um deri Faktor 2 zu klein. Bei etwa Norrn- 
geschwindigkeit kann der V-Wert mit Hilfe der Plausibilitat korrigiert werden. Wird aber erheblich langsamer als Norm- 
geschwindigkeit gescannt, dann kann auf diese Art der V-Wert nicht mehr korrigiert werden. In diesem Falle werden die 30 
WeiB-schwarz- bzw. Schwarz-weiB-t)bergange des Zeichens naher untersucht Es werden drei unmittelbar ubereinander 
liegende Pixelzeilen in der entsprechenden Spalte betrachtet (siehe Fig. 4). Haben die drei Pixelzeilen annahernd den 
gleichen Kurvenverlauf und ist die Grauwertdifferenz zwischen dem hellsten und dunkelsten Pixel groBer als 15, dann 
wird ein Steigungsmafi bei jedem WeiB-schwarzVSchwarz-weiB-Ubergang von jeder Zeile ermittelt. 

Dies wird foigendermaBen durchgefuhrt. 35 

In Fig. 1 sind die original gescannten Grauwertbilddaten abgebildet. Man sieht, dass die Zeile am Anfang erhebbch 
langsamer als am Ende des Belegs gescannt wurde. 

GemaB Fig. 3 wurde beispielhaft eine Zeile (Zeile 28) herausgegriffen. Die Bilddaten sind so aufgebaut, dass links die 
Spalte 0 und oben die Zeile 0 ist. GemaB Fig. 3 ist von der Zeile 28 die Grauwertverteilung dargestellt. Man erkennt, wie 
sich die Stcilhcit der Flankc abhangig von der Scanngcschwindigkcit vcrandcrt Als crstcs wird der Bcginn cincr Flankc 40 
gesucht. Es wird der WeiBwert des Belegs ermittelt. Mittels einer Schwelle kann das Pixel gefunden werden, das iiber 
dieser Schwelle liegt. Jetzt wird von Pixel zu Pixel die Differenz (d) berechnet und gespeichert, bis die Differenz wieder 
einen Schwellenwert unterschreitet oder die Polaritat wecbselt. Aus den Differenzen Dl bis Dn wird der maximale Wert 
dmax ermittelt. Nun wird ein Wert f nach folgender Formel berechnet. 



f = dmax {- 



45 



dl d2 dn 

Die Wert wird nun iiber eine Tabelle korrigiert, und man erhalt den V-Wert (b). so 

Beispiel 

Zeichen 1 : f = 3, 4 KorrckturtabcUc crgibt 2,37 = V-Wert (b). 

Zeichen 2: f = 2, 3 KoirekturtabeUe ergibt 1,50 = V-Wert (b). 55 
Zeichen 3: f = 1,5 Korrekturtabelle ergibt 1,00 = V-Wert (b) = Normgeschwindigkeit. 

Kfi.erbei bedeutet zum Beispiel ein V-Wert von 2,37, dass das Zeichen um diesen Faktor in horizontaler Richtung ver- 
kleinert werden muss. Bei einem V-Wert = 1 wird das Zeichen nicht verandert. 

AnschlieBend wird noch eine Wertbildung der V-Werte von drei unmittelbar untereinander liegenden Zeilen durchge- 
fuhrt. Dieser V-Wert (b) ist ein MaB fur die Scanngeschwindigkeit. Der V-Wert (b) wird jetzt mit dem V-Wert (a) vergli- 60 
chen. Weicht der V-Wert (b) mehr als 50% vom V-Wert (a) ah, dann wird der V-Wert (b) fur den V-Wert eingesetzt. 

AnschlieBend wird das Programm 214 zur Glattung der V-Werte und zum Abspeichern der Scanngeschwindigkeit in 
das SRAM durchgefuhrt. Hierbei wird der Mittelwert von 4 V-Werten gebildet Die letzten drei V-Werte (Belegende) be- 
kommen den Wert des zuletzt ermittelten V- Wertes. Bei der Glattung wird vorher abgefragt, ob der n^chste Wert einen zu 
groBen Abstand zum vorhergehenden hat. Ist dies der Fall, wild er gleich dem vorhergehenden gesetzt, da eine zu groBe 65 
Abweichung der Geschwindigkeit von Zeichen zu Zeichen nicht vorkommen kann. 

Ist bei einem V-Wert das hochste Bit 1, so wird dieser V-Wert noch uberschrieben, und Programm 212 wird aufgeru- 
fen. Mit den Endcodc Oxffff wird die Schleife vcrlasscn. AnschlieBend wird Programm 216 aufgerufen. 



5 



DE 100 09 761 A 1 

Mittels Programm 216 wird der ermittelte V-Wert in die "komprimierte Tapete" (Puffer REZ) eingetragen. In Puffer 
WEZ befindet sich die Spaltenmittenadresse der Zeichen und der V-Werte. 
Dies wird folgendermaBen durchgefuhrt: 

Im RAM Puffer RHZ und WHZ sind jeweils die Spaltenadressen am Anfang einer Spalte abgespeichert Die Spalten- 
5 adressen laufen syncron zueinander. Es wird nun die Spaltenadresse 1 des Puffers REZ als Startadresse genommen und 
die V-Wert aufaddiert. Da es sich um eine komprimierte Tapete handelt, muss nicht notwendigerweise eine Spalten- 
adresse 2 existieren. 1st die nachste Spaltenadresse zum Beispiel 5, dann muss der V-Wert n-mal auf die Spaltenadresse 1 
addiert werden. Mit jeder Addition wird eine fortlaufende Adresse inkrementiert. Wahrend der Addition wird die neue 
Spaltenadresse inil der im Puffer WEZ verglichen. 1st die neue Spaltenadresse ganzzahlig groBer als die Puffer WEZ, 
to wird die fordaufende Adresse als neue Adresse in REZ ubernommen. 

Die Beleggeschwindigkeit kann schneller, gleich oder langsamer als die Sollgeschwindigkeit sein. 1st sie schneller, 
werden die Bilddaten gespreizt 1st die Beleggeschwindigkeit lang, werden die Bilddaten gestaucht, und entspricht die 
Beleggeschwindigkeit der Normgeschwindigkeit, dann verandern sich die Bilddaten nicht 

Alle Programme 206 bis 216 wurden auf den komprimierten Bilddaten durchgefuhrt Das Programm 218 dient zur In- 
15 itialisierung des Programms 120; welches die komprimierte Tapete wieder dekomprimiert. 
AuBerdem speichert das Programm 220 die dekomprimierte Tapete im Bildspeicher ab. 

Hierbei werden Spalte fur Spalte die im Puffer REZ abgespeicherten Grauwertstutzpunkte zeilenweise miteinander 
verbunden und im Bildspeicher abgespeichert. Hierbei werden der Spaltenabstand zwischen den Grauwertpixein und die 
Hohe der Grauwerte beriicksichtigt, so dass es unterschiedliche Grauwertkeile in horizontaler Richtung gibt Auf diese 
20 Weise entsteht ein in horizontaler Richtung korrigiertes Bild im Bildspeicher, das zur Zeichenerkennung verwendet wird. 

Das Programm 222 ubertragt die Bilddaten des Bildspeichers in den FRAM Puffer (neuer WEZ). Hier liegen nach Be- 
endigung der Bearbeiturig des Scannvbrgangs die endgtlltigen Bilddaten (siehe Fig. 2). 

Da der Bildspeicher nur 64 Spalten groB ist, zur Rekonstruklion der Bilddaten aus der komprimierten Tapete aber etwa 
30 Spalten bendtigt werden, muss nach 32 Spalten die Halfte des Bildspeichers in das SRAM abgespeichert werden. Das 
25 Programm 220 kann dann den Bildspeicher wieder laden. 

Die Schlcifc aus den Programmcn 220 und 222 wird solangc durchgefuhrt, bis kcinc Datcn mchr im SRAM-Puffcr 
REZ vorhanden sind. 

Danach wird die Zeichenerkennungssoftware 224 aufgerufen. Bei der Ennitdung der Scanngeschwindigkeitswerte 1st 
die Ermittlung der S teigungsmaBe bei j edem der WeiB- schwarz- beziehungsweise Sen warz- weiB-Ubergange jeder Zeile 

30 nur dann erforderlich, wenn bei der Ermittlung der Scanngeschwindigkeitswerte iiber den Mittenabstand zweier benach- 
barter Zeichen Unsicherheiten in der Zeichenteilung bestehen. Dies kann der Fall sein, wenn Zeichen unterbrpehen sind 
oder es keine WeiBliicke zwischen den Zeichen gibt. Bei Proportionalschriften sollte die Ermittlung der Scanngeschwin- 
digkeiten uber SteigungsmaBe der Ubergange generell erfolgen, da bei diesen Schriften die Zeichenteilung nicht kon- 
stant ist. Eine exakte Geschwindigkeitskorrektur ist bei Proportionakchriften nicht notwendig, da die Zeichen ohnehin 

35 unterschiedlich breit sind, und die ein Problem darstellt, welches durch die Zeichenerkennung gelost werden muss. 

Obwohl die Erfindung anhand einer bevorzugten Ausfuhrungsform beschrieben wurde, ist klar zu verstehen, dass sie 
hierauf nicht beschrankl ist Die Einrichtung eines SRAM-PulTers ist nicht zwingend notwendig, sondern vorleilhaft 
Seibstverstandlich kann auch ein anderer Speicher verwendet werden, etwa ein DRAM oder ahnliches. Ebenso sind die 
in dem ausgefuhrten Beispiel angegebenen Zahlenwerte abanderbar. So konnen beispielsweise auch Scanner mit mehr 

40 als 64 Zcilcn verwendet werden. 

Patentanspriiche 

1. Verfahren zur Aufhahme von Bilddaten einer Zeichenzeile, wobei eine Zeichenzeile einer Vorlage zum Lesen 
45 von Bilddaten abgetastet und die Bilddaten fur eine OCR-Erkennung vorbereitet werden, dadurch gekennzeich- 

net, dass die Zeichenteilung beruhend auf den Bilddaten bestimmt wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Zeichenteilung aus dem Abstand aufeinanderfol- 
gender Zeichen bestimmt wird. 

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass zusatzlich die Ubergangsscharfe an den Zeichenkan- 
50 ten bestimmt wird, wobei die Ubergangsscharfe zur Uberprufung der aus dem Zeichenabstand ermittelten Zeichen- 
teilung dient. 

4. Verfahren nach einem der Anspriiche 1 bis 3, dadurch gekennzeichnet, dass die gelesenen Bilddaten komprimiert 
werden. 

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die komprimierten Bilddaten als Grauwerte in cincm 
55 SRAM einer Zeichenerkennungseinheit fur Grauwert-Videodaten abgespeichert werden. 

6. Verfahren nach einem der Anspriiche 1 bis 5, dadurch gekennzeichnet, das es die Schritte 

- Komprimieren der eingelesenen Bilddaten und Speichern als Grauwerte in einem SRAM-Puffer 

— Abspeichern von Grauwertstutzpunkten zum Biiden einer komprimierten lapete 

— Biiden von Zeichenmittenabstanden aufeinanderfblgender Zeichen 

60 - Biiden von Scanngeschwindigkeitswerten und Eintragen dieser Scanngeschwindigkeitswerte in die kompri- 

mierte Tapete 

- Dekomprimieren der komprimierten Tapete 
umfasst. 

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass beim Biiden der Grauwertstutzpunkte die als Grau- 
65 werte abgespeicherten Bilddaten zeilenweise unter Bildung von Grauwertdifferenzen zu einem fur jede Zeile ermit- 
telten WeiBwert untersucht werden, wobei bei Uberschreiten einer vorbestimmten Grauwertdifferenz jeweils ein 
Grauwertstiitzpunkt in den SRAM-Puffer eingetragen wird. 

8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass vor dem Biiden von Zeichenmittenabstanden 
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aufeinanderfolgender Zeichen Grauwerte unterhalb eines jeweiligen Schwellenwertes auf 0 gesetzt werden, wobei 
die Schwellenwerte jeweils zeilenweise abhangig von einem maximalen, in horizontaler Richtung ermittelten Grau- 
wert gebildet werden. 

9. Verfahren nach einem der Anspruche 6 bis 8, dadurch gekennzeichnet, dass die Scanngeschwindigkeitswerte aus 
den Mittenabstanden aufeinanderfolgender Zeichen mittels einer Mehrheitssuche bestimrnt werden. 5 

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass bei der Ermittlung der Scanngeschwindigkeiten die 
SteigungsmaBe der Schwarz-weiB- beziehungsweise WeiB-schwarz-Ubergange der jeweiligen Zeichenteile in hori- 
zontaler Richtung ermittelt werden. 

11. BUdaufnahine vorrichtung zur Aufnahnie von Bilddaten einer Zeichenzeile mil 

einer Aufnahmevorrichtung zur Abtastung einer Vorlage, um die Bilddaten einer Zeichenzeile zu lesen, und 10 
einer Verarbeitungsvonichtung, urn unter Beriicksichtigung einer tatsachlichen Zeichenzeile die Bilddaten fur eine 
OCR-Erkennung vorzubereiten, um so verzerrungsfreie Bilddaten zu erhalten, 

dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung ausgestattet ist, um die Zeichenteilung beruhend auf 
den Bilddaten zu bestimmen. 

12. Bildaufhahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung aus- 15 
gestattet ist, um den Ab stand zwischen aufeinanderfolgenden Zeichen zu ermitteln und aus diesem Abstand die Zei- 
chenteilung bestimmen. 

13. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung die 
Ubergangsscharfe an den Zeichenkanten bestimrnt, wobei die Ubergangsscharfe ein MaB fur die Zeichenteilung ist. 

14. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, dass die Verarbeitungsvorrichtung zusatzlich die 20 
Ubergangsscharfe an den Zeichenkanten bestimrnt, wobei die tjbergangsscharfe zur Uberpriifung der aus dem Zei- 
chenabstand ermittelten Zeichenteilung dient. 

15. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Aufnahmevorrichtung ein 
handgefuhrter Scanner ist. 

16. Bildaufnahmevorrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Vorrichtung einen Speicher. 25 
aufwcist, um die Bilddaten zwischcnzuspcichcm. 
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